Задача мониторинга параметров геомагнитного поля и его вариаций преимущественно решается сетью магнитных обсерваторий и вариационных станций, однако значимым препятствием при обработке и анализе получаемых таким образом данных наряду с их пространственной анизотропией являются пропуски (или полное отсутствие) достоверных значений и частичное несоответствие установленному формату. Неоднородность и аномальность данных исключает (существенно усложняет) возможность их автоматической интеграции и применения к ним инструментария для частотного анализа. Известные решения по интеграции разнородных геомагнитных данных базируются преимущественно на модели консолидации и лишь частично решают данную проблему. Получаемые в результате наборы данных, как правило, не соответствуют требованиям IAGA (International Association of Geomagnetism and Aeronomy — Международной ассоциации геомагнетизма и аэрономии), рекомендуемым к представлению результатов геомагнитных наблюдений. При этом пропуски во временных рядах устраняются известными средствами обработки геомагнитных данных путем исключения отсутствующих или аномальных значений из конечной выборки, что, очевидно, может привести как к потере актуальной информации о ходе изменения параметров геомагнитного поля и его вариаций, нарушению шага дискретизации, так и к неоднородности временного ряда. Предлагается подход к созданию единого пространства геомагнитных данных, основанный на комбинировании моделей консолидации и федерализации, включающий предварительную обработку исходных временных рядов с опционально доступной процедурой их восстановления и верификации, ориентированный на применение технологий облачных вычислений и иерархического формата с целью повышения вычислительной скорости обработки больших объемов данных и, как следствие, обеспечивающий получение пользователями более качественных и однородных данных.
В настоящее время интенсивное развитие систем и технологий регистрации параметров магнитного поля Земли способствует экспоненциальному росту объемов геомагнитных данных, основным источником которых выступают постоянные магнитные станции. Несовершенство применяемой аппаратуры и задействованных каналов передачи информации обуславливает наличие пропусков во временных рядах зарегистрированных данных, что вместе с пространственной анизотропией создает серьезное препятствие для обработки геомагнитных данных при решении прикладных задач. Российские и зарубежные научные организации восстанавливают пропущенные геомагнитные данные методом линейной интерполяции, что обеспечивает приемлемые результаты в условиях спокойной магнитосферы, но значительно искажает временные ряды при изменении окружающей магнитной обстановки. В этой связи возникает актуальная научно-техническая задача разработки подхода к восстановлению геомагнитных данных в условиях возбужденной магнитосферы, обеспечивающего оптимальные метрики качества импутации временных рядов.
Авторами предложен метод восстановления временных рядов, основанный на индуктивном методе обучения алгоритмов. Согласно предлагаемому подходу, каждая магнитная станция оперирует собственной базой знаний, формируемой в ходе регистрации параметров геомагнитного поля и его вариаций. Комбинация значений ряда, предшествующих и следующих за пропуском, является признаковым описанием, применяемым для поиска прецедента в базе знаний магнитной станции. Результат содержит искомый фрагмент временного ряда и заменяет пропущенные значения его уровней. Сложность характера информационного сигнала, обусловленная неспокойной магнитной обстановкой, повышает точность поиска по прецедентам, эффективность которого тем выше, чем большей базой знаний располагает магнитная станция.
Проведенный анализ результатов восстановления пропусков временных рядов геомагнитных данных, зарегистрированных в условиях возбужденной магнитосферы, показал, что предложенный индуктивный метод импутации позволяет повысить точность восстановления пропущенных значений в среднем на 79.54 % по сравнению с используемыми в настоящее время методами, что позволит повысить эффективность обработки геомагнитных данных при решении прикладных задач.
Сингулярный спектральный анализ (ССА) является сравнительно новым методом анализа временных рядов. ССА представляет особый интерес в приложении к анализу нестационарных, коротких и зашумлённых рядов. Одной из слабых сторон метода является то, что простые гармонические колебания, как и более сложные компоненты, анализируемого временного ряда раскладываются на более чем одну компоненту, что приводит к необходимости группировки связанных компонент для дальнейшего анализа. Данная проблема частично рассматривается в работе Александрова и Голяндиной (2005), преимущественно в приложении к проблеме идентификации чистых гармонических колебаний.
В данной работе предлагается более гибкий и обобщённый алгоритм для автоматической группировки компонент (а также его модификация), позволяющий группировать не только компоненты, соответствующие гармоническим колебаниям, но и компоненты, соответствующие амплитудно-модулированным колебаниям, затухающим колебаниям и др. Алгоритм был апробирован на искусственных наборах данных, содержащих в себе следующие распространенные формы компонент: гармоническое, амплитудно-модулированное и экспоненциально-затухающее колебания, сумма двух кривых Гаусса, а также их различные аддитивные комбинации. Экспериментально получены оценки качества группировки и показано, что показатели качества группировки у предложенных алгоритмов в среднем лучше на 26%, чем показатели известного алгоритма.
Сингулярный спектральный анализ (ССА) является относительно новым методом анализа нестационарных временных рядов. Слабой стороной ССА является отсутствие аналитического модельного представления ряда, например, в виде суммы простых функций, компактное аналитическое представление которых могло бы быть нагляднее и доступнее для интерпретации, чем совокупность большого количества компонент. В настоящей работе описан оригинальный метод вариативного моделирования, позволяющий устранить отмеченную слабую сторону ССА путем совместного использования его и метода моделетеки для получения компактного и легко интерпретируемого модельного представления изучаемого временного ряда с желаемым уровнем его адекватности ряду, цели и условиям идентификации. Первый этап предлагаемого метода заключается в разложении исходного временного ряда на компоненты с помощью ССА. Разложение исходного ряда завершается выделением интересующих исследователя компонент. На втором этапе компоненты идентифицируются моделями из априори сформированной моделетеки согласно целям идентификации. Результатом является результирующая модель исходного временного ряда в аддитивной или аддитивно-мультипликативной форме. Применимость метода рассматривается на примерах идентификации искусственного ряда и реальных ежедневного данных изменения мутности воды в реке в г. Челябинске за 2005 г. Первый этап предлагаемого метода заключается в разложении исходного временного ряда на компоненты с помощью ССА. Разложение исходного ряда завершается выделением интересующих исследователя компонент. На втором этапе компоненты идентифицируются моделями из априори сформированной моделетеки согласно целям идентификации. Результатом является результирующая модель исходного временного ряда в аддитивной или аддитивно-мультипликативной форме. Применимость метода рассматривается на примерах идентификации искусственного ряда и реальных ежедневного данных изменения мутности воды в реке в г. Челябинске за 2005 г.
Рассматривается метод анализа сингулярного спектра («гусеница») приме- нительно к метрикам, базирующимся на значениях сетевого трафика и загрузки систе- мы, с целью определения влияния DDoS-атак на главные компоненты временных рядов этих метрик. Выявленное поведение главных компонент в момент начала атаки и при её продолжении может использоваться при разработке средств обнаружения вторжений.
Рассмотрен метод анализа сингулярного спектра («гусеница») и его применение в области анализа временных рядов сетевого трафика на Web-сервере с целью выявления DDoS-атак на сервер. Выполнено разложение исходных рядов, выявлены особенности собственных функций и главных компонент рядов в разных режимах работы системы.
В статье рассматривается сравнительный анализ методов исследования входных и выходных данных и внутренних трафиков информационной системы. Предложен подход к обнаружению атак отказа в обслуживании, основывающийся на анализе временных рядов. Приводятся результаты обнаружения атак на основе пороговых значений.
Рассматривается развитие процедур оценивания интенсивности поведения по данным о минимальном, максимальном и обычном интервале между эпизодами указанного поведения. Математической моделью поведения выступает пуассоновский процесс; наблюдения представляют собой ответы респондентов на естественном языке об указанных интервалах. Описанный в статье подход учитывает гранулярность исходных данных и основывается на использовании аппарата порядковых статистик и применении метода рандомизации. Рассмотрены примеры применения полученных оценок для анализа не только рискованного, но и ругих видов социально-значимого поведения.
Статья отражает результаты очередного этапа исследований, посвященных подходам к оценке интенсивности рискованного поведения. Статья содержит описание способов формирования указанной оценки интенсивности на основе максимального и минимального интервала, а также интервала-медианы между эпизодами поведения. Решение рассматриваемой задачи основывается на формировании и анализе формул для функции распределения (и совместного распределения) соответствующих порядковых статистики, плотности распределения, а также на выборе значений его параметров. Предложены подходы к анализу качества полученных оценок.
Расматривается задача совместной обработки разнотипных биометрических данных, полученных в результате измерений пульса, микровибраций лица, и оценки уровня тревожности на основе психологического тестирования. В частности, находятся скрытые признаки, различающие две группы практически здоровых испытуемых: 1) людей различного пола и возраста; 2) беременных женщин. Приводятся предварительные результаты анализа экспериментальных данных методами data mining.
1 - 10 из 10 результатов